智能论文笔记

Bengali Common Voice Speech Dataset for Automatic Speech Recognition

Samiul Alam , Asif Sushmit , Zaowad Abdullah , Shahrin Nakkhatra , MD. Nazmuddoha Ansary , Syed Mobassir Hossen , Sazia Morshed Mehnaz , Tahsin Reasat , Ahmed Imtiaz Humayun

分类：自然语言处理

2022-06-28

孟加拉语是世界上说话最多的语言之一，全球有超过3亿的演讲者。尽管它很受欢迎，但由于缺乏多样化的开源数据集，对孟加拉语音识别系统的发展的研究受到阻碍。作为前进的道路，我们已经众包孟加拉语音语音数据集，这是句子级自动语音识别语料库。该数据集于Mozilla Common Voice平台上收集，是正在进行的广告系列的一部分，该活动已在2个月内收集了超过400个小时的数据，并且正在迅速增长。我们的分析表明，与OpenSLR孟加拉ASR数据集相比，该数据集具有更多的发言人，音素和环境多样性，这是最大的现有开源孟加拉语语音数据集。我们提供从数据集获得的见解，并讨论未来版本中需要解决的关键语言挑战。此外，我们报告了一些自动语音识别（ASR）算法的当前性能，并为将来的研究设定了基准。

translated by 谷歌翻译

An Approach of Adjusting the Switch Probability based on Dimension Size: A Case Study for Performance Improvement of the Flower Pollination Algorithm

Tahsin Aziz , Tashreef Muhammad , Md. Rashedul Karim Chowdhury , Mohammad Shafiul Alam

分类：神经与进化计算

2022-08-20

大自然影响了许多元元素算法。在过去的几十年中，它们的数量一直在升级。这些算法中的大多数试图模仿自然的生物学和物理现象。这项研究集中在花授粉算法上，该算法是几种生物启发的算法之一。建议使用特定的全球授粉和局部授粉策略，建议在限制空间中进行花粉谷物探索和剥削。作为一种“群”元元素算法，其强度在于找到最佳解决方案的附近，而不是识别最小值。这项工作详细介绍了对原始方法的修改。这项研究发现，通过更改“开关概率”的特定值，具有不同尺寸和功能的动态值，结果主要比原始花授粉法改进。

translated by 谷歌翻译

Learning Topological Interactions for Multi-Class Medical Image Segmentation

Saumya Gupta , Xiaoling Hu , James Kaan , Michael Jin , Mutshipay Mpoy , Katherine Chung , Gagandeep Singh , Mary Saltz , Tahsin Kurc , Joel Saltz

分类：计算机视觉

2022-07-20

深度学习方法为多级医学图像细分实现了令人印象深刻的表现。但是，它们的编码不同类别（例如遏制和排除）之间拓扑相互作用的能力受到限制。这些约束自然出现在生物医学图像中，对于提高分割质量至关重要。在本文中，我们介绍了一个新型的拓扑交互模块，将拓扑相互作用编码为深神经网络。该实施完全基于卷积，因此非常有效。这使我们有能力将约束结合到端到端培训中，并丰富神经网络的功能表示。该方法的功效在不同类型的相互作用上得到了验证。我们还证明了该方法在2D和3D设置以及跨越CT和超声之类的不同模式中的专有和公共挑战数据集上的普遍性。代码可在以下网址找到：https：//github.com/topoxlab/topointeraction

translated by 谷歌翻译

EVHA: Explainable Vision System for Hardware Testing and Assurance -- An Overview

Md Mahfuz Al Hasan , Mohammad Tahsin Mostafiz , Thomas An Le , Jake Julia , Nidish Vashistha , Shayan Taheri , Navid Asadizanjani

分类：人工智能 | 计算机视觉 | 机器学习

2022-07-20

由于对不同部门的电子芯片的需求不断增长，因此，半导体公司被授权离岸其制造流程。这一不必要的事情使他们对筹码的筹码有关，并引起了硬件攻击的创造。在这种情况下，半导体供应链中的不同实体可以恶意行事，并对从设备到系统的设计计算层进行攻击。我们的攻击是一个硬件特洛伊木马，在不受信任的铸造厂中插入了在面具的生成/制造过程中。特洛伊木马在制造，通过添加，删除或设计单元的变化中留下了脚印。为了解决这个问题，我们在这项工作中提出了可解释的视觉系统，用于硬件测试和保证（EVHA），可以检测以低成本，准确和快速的方式对设计的最小变化。该系统的输入是从正在检查的集成电路（IC）中获取的扫描电子显微镜（SEM）图像。系统输出是通过添加，删除或在单元格级的设计单元格中使用任何缺陷和/或硬件木马来确定IC状态。本文概述了我们的防御系统的设计，开发，实施和分析。

translated by 谷歌翻译

AI and Pathology: Steering Treatment and Predicting Outcomes

Rajarsi Gupta , Jakub Kaczmarzyk , Soma Kobayashi , Tahsin Kurc , Joel Saltz

分类：人工智能

2022-06-15

数据分析方法的组合，提高计算能力和改进的传感器可以实现定量颗粒状，基于细胞的分析。我们描述了与组织解释和调查AI方法有关的丰富应用挑战集，目前用于应对这些挑战。我们专注于一类针对性的人体组织分析 - 组织病理学 - 旨在定量表征疾病状态，患者结果预测和治疗转向。

translated by 谷歌翻译

Evaluating histopathology transfer learning with ChampKit

Jakub R. Kaczmarzyk , Tahsin M. Kurc , Shahira Abousamra , Rajarsi Gupta , Joel H. Saltz , Peter K. Koo

分类：计算机视觉 | 机器学习

2022-06-14

组织病理学仍然是各种癌症诊断的黄金标准。计算机视觉的最新进展，特别是深度学习，促进了针对各种任务的组织病理学图像的分析，包括免疫细胞检测和微卫星不稳定性分类。每个任务的最新工作通常采用鉴定的基础体系结构，这些体系结构已鉴定为图像分类。开发组织病理学分类器的标准方法倾向于将重点放在优化单个任务的模型上，而不是考虑建模创新的各个方面，从而改善了跨任务的概括。在这里，我们提出了Champkit（模型预测工具包的全面组织病理学评估）：可扩展的，完全可重现的基准测试工具包，由大量的斑点级图像分类任务组成，跨不同的癌症。 Champkit能够系统地记录模型和方法中提议改进的性能影响的一种方法。 Champkit源代码和数据可在https://github.com/kaczmarj/champkit上自由访问。

translated by 谷歌翻译

Metrics reloaded: Pitfalls and recommendations for image analysis validation

Lena Maier-Hein , Annika Reinke , Evangelia Christodoulou , Ben Glocker , Patrick Godau , Fabian Isensee , Jens Kleesiek , Michal Kozubek , Mauricio Reyes , Michael A. Riegler

分类：计算机视觉

2022-06-03

自动生物医学图像分析的领域至关重要地取决于算法验证的可靠和有意义的性能指标。但是，当前的度量使用通常是不明智的，并且不能反映基本的域名。在这里，我们提出了一个全面的框架，该框架指导研究人员以问题意识的方式选择绩效指标。具体而言，我们专注于生物医学图像分析问题，这些问题可以解释为图像，对象或像素级别的分类任务。该框架首先编译域兴趣 - 目标结构 - ，数据集和算法与输出问题相关的属性的属性与问题指纹相关，同时还将其映射到适当的问题类别，即图像级分类，语义分段，实例，实例细分或对象检测。然后，它指导用户选择和应用一组适当的验证指标的过程，同时使他们意识到与个人选择相关的潜在陷阱。在本文中，我们描述了指标重新加载推荐框架的当前状态，目的是从图像分析社区获得建设性的反馈。当前版本是在由60多个图像分析专家的国际联盟中开发的，将在社区驱动的优化之后公开作为用户友好的工具包提供。

translated by 谷歌翻译

Common Limitations of Image Processing Metrics: A Picture Story

Annika Reinke , Minu D. Tizabi , Carole H. Sudre , Matthias Eisenmann , Tim Rädsch , Michael Baumgartner , Laura Acion , Michela Antonelli , Tal Arbel , Spyridon Bakas

分类：计算机视觉

2021-04-12

尽管自动图像分析的重要性不断增加，但最近的元研究揭示了有关算法验证的主要缺陷。性能指标对于使用的自动算法的有意义，客观和透明的性能评估和验证尤其是关键，但是在使用特定的指标进行给定的图像分析任务时，对实际陷阱的关注相对较少。这些通常与（1）无视固有的度量属性，例如在存在类不平衡或小目标结构的情况下的行为，（2）无视固有的数据集属性，例如测试的非独立性案例和（3）无视指标应反映的实际生物医学领域的兴趣。该动态文档的目的是说明图像分析领域通常应用的性能指标的重要局限性。在这种情况下，它重点介绍了可以用作图像级分类，语义分割，实例分割或对象检测任务的生物医学图像分析问题。当前版本是基于由全球60多家机构的国际图像分析专家进行的关于指标的Delphi流程。

translated by 谷歌翻译